import pandas as pd
from matplotlib import pyplot as plt


file_path = "./csv/books.csv"

df = pd.read_csv(file_path)
# print(df.head(2))
#
# print(df.info())

 # 不同年份书的数量
# data1 = df[pd.notnull(df["original_publication_year"])] # 删除缺失年份，original_publication_year 出版年份
#
# grouped = data1.groupby(by="original_publication_year").count()["title"]


#不同年份书的平均评分情况
#去除original_publication_year列中nan的行
data1 = df[pd.notnull(df["original_publication_year"])] # 删除缺失年份，original_publication_year 出版年份

grouped = data1["average_rating"].groupby(by=data1["original_publication_year"]).mean() # average_rating 平均评分

# 有负值是因为公元前的
# print(grouped)

_x = grouped.index
_y = grouped.values

#画图
plt.figure(figsize=(20,8),dpi=80)
plt.plot(range(len(_x)),_y)
print(len(_x))

plt.xticks(list(range(len(_x)))[::10],_x[::10].astype(int),rotation=45) # 取步长
plt.show()